Classification automatique de courriers électroniques par des méthodes mixtes d'apprentissage

نویسندگان

  • Rémy Kessler
  • Juan-Manuel Torres-Moreno
  • Marc El-Bèze
چکیده

RÉSUMÉ. Les nouvelles formes de communication écrite (courriels, forums, chats, SMS, etc.) ont introduit des défis considérables pour leur traitement automatique. Ces données présentent des phénomènes linguistiques bien particuliers : messages trop courts, très bruités... Nous présentons des recherches destinées à créer des outils et des ressources génériques pour la classification de courriels. Nous nous attachons à traiter dans cette étude des problèmes posés par le routage précis de courriels. Après un processus de filtrage et de lemmatisation, nous utilisons la représentation vectorielle de textes avant d’effectuer la classification par des approches supervisées, semi-supervisées et non supervisées. Lors des tests, nous avons obtenu de très bonnes performances sur des corpus réalistes.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Comparaison des mammographies par des méthodes d'apprentissage

Les mammographies sont le moyen le plus répandu pour la détection du cancer du sein. Des études ont démontré qu’une lecture double des mammographies augmente la sensitivité du diagnostic jusqu’à 15% (Bird et al., 1992) et de plus, (Destounis et al., 2004), que les outils d’aide au diagnostic automatique du cancer du sein (ADACS) peuvent améliorer même les résultats d’une double lecture des mamm...

متن کامل

Classification de courriers électroniques. Une approche par apprentissage basée sur des modèles linguistiques

RÉSUMÉ. Nous proposons une double amélioration des systèmes de filtrage de courriels existants. D’une part, en utilisant une méthode d’apprentissage automatique permettant à un système de filtrage d’élaborer des profils utilisateur. D’autre part, nous utilisons un ensemble de connaissances linguistiques sous forme de modèles réduits issues de modèles linguistiques de textes. Dans ce contexte, n...

متن کامل

PRÉSENTATION. Géomatique et ingénierie de l'information. Objets mobiles et réseaux spatiaux

Ce numéro spécial regroupe des articles sélectionnés à l'issue de l'édition 2010 de la conférence internationale de géomatique et analyse spatiale SAGEO (Spatial Analysis and GEOmatics) 1 organisée à Toulouse du 17 au 19 novembre par les Unités mixtes de recherche DYNAFOR 2 et GEODE 3 sous l'égide des GdR MAGIS 4 (Groupement de recherche « Méthodes et applications pour la géomatique et l'inform...

متن کامل

Khiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables

Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...

متن کامل

Une approche multi-agent adaptative pour la simulation de schémas tactiques

Résumé. Ce papier est consacré à la simulation ou à la réalisation automatique de schémas tactiques par un groupe d ́agents footballeurs autonomes. Son objectif est de montrer ce que peuvent apporter des techniques d'apprentissage par renforcement à des agents réactifs conçus pour cette tâche. Dans un premier temps, nous proposons une plateforme et une architecture d'agents capable d'effectuer d...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Ingénierie des Systèmes d'Information

دوره 11  شماره 

صفحات  -

تاریخ انتشار 2006